AI资讯新闻榜单内容搜索- 大模型

1/8 参数，跑赢 80B 大模型：Boogu-Image 是黑马还是鸡肋？

2026 年 6 月，HuggingFace 上一个名为 Boogu-Image-0.1 的开源模型，在上传以后迅速引爆了 AI 圈。这款模型最引人注目的地方，在于它以区区 10B 的参数规模，就在多项关键能力上超过了很多参数量更大的模型。

来自主题: AI资讯

8058 点击 2026-07-08 22:15

具身智能空间视觉死穴，终于被最新顶会彻底解决！

VLA 大模型看似强大，却被一个致命弱点扼住喉咙——相机稍微挪动几毫米，操作成功率就能暴跌一半。招商局先进技术研究院下属实验室提出新的移动数据范式，首次在真实机器人系统上证明：让相机动起来采集数据，就能以极低成本破解 VLA 的空间泛化瓶颈，且效果普适于多种主流架构。被一个致命弱点扼住喉咙——相机稍微挪动几毫米，操作成功率就能暴跌一半。

来自主题: AI技术研报

8293 点击 2026-07-08 09:46

ICML 2026 | 大模型为什么算不对加法？南大团队提出等本位和轨迹，揭示LLM算术错误的几何机制

尽管大语言模型（Large Language Models, LLMs）在复杂数学推理、代码生成和知识问答上表现突出，但它们仍常在多位数加法这类基础算术任务上犯错。

来自主题: AI技术研报

7555 点击 2026-06-17 14:05

连续入选ICRA最佳论文，RoboScience机器科学如何突破具身智能泛化瓶颈？

在具身智能最难的泛化问题上，他们连续拿出顶会级成果，并把它们沉淀进其创新 VLOA 大模型，推动机器人迈向广阔现实。

来自主题: AI技术研报

9846 点击 2026-06-08 10:45

这家创业公司发现了大模型的一个根本性缺陷

你有没有想过，我们每天用的 AI 大模型，可能在某些词汇上天生就有缺陷？不是因为训练数据不够，不是因为算力不足，而是因为语言本身的规律——那些用得少的词，模型就是学不好。更让人意外的是，这个问题早在 2025 年就被一家中国创业公司系统性地发现并解决了。

来自主题: AI技术研报

7269 点击 2026-05-28 09:52

独家｜ChatGPT核心贡献者姜旭归国创业：把LLM的Scaling带到具身智能

姜旭是少数完整参与过 OpenAI 大模型核心技术演进的华人创业者之一。2019 至 2023 年间，他经历了 GPT 系列能力爆发最关键的阶段，工作横跨底层训练 infra、大规模预训练、RLHF 对齐算法与数据构建等核心链路。

来自主题: AI资讯

10938 点击 2026-05-22 10:26

ICML 2026 Spotlight| 拒绝盲目猜token，阿里x浙大将投机解码带入弹性预算时代

随着大模型参数规模持续扩大，推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码（Speculative Decoding, SD）通过「小模型 draft + 大模型 verify」的方式，将多个候选 token 放到一次目标模型前向中并行验证，从而缓解自回归解码的串行瓶颈。

来自主题: AI技术研报

8586 点击 2026-05-13 15:01

ICML 2026 | 大模型内部也会长出「情绪树」，规模越大越懂人心

随着语音、视频、多模态能力不断融入大语言模型（LLM），人与 AI 的交互正在越来越接近自然对话。今天的 LLM 不再只是回答问题的工具，也越来越多地出现在教育、客服、陪伴、心理健康等高度依赖情绪理解的场景中。

来自主题: AI技术研报

6555 点击 2026-05-12 14:31

独家｜RoboScience 机器科学完成10亿元融资，资金将用于强化 VLOA 大模型与本体

独家获悉，RoboScience 机器科学于近日完成十亿元 A 轮融资，投资方包含多家国内外知名产业巨头及一线财务机构。本轮融资将用于持续深化其核心的 VLOA 大模型技术，以及推进自研机器人本体的工程化与量产，加速通用具身智能解决方案的规模化落地。

来自主题: AI资讯

9042 点击 2026-05-06 09:20

不可思议！400B大模型在iPhone上跑起来了

刚看到这个 Demo 的时候着实有些想笑，很久没有见过吐词如此之慢的大模型了。观感上就像「闪电」老师。尽管只有每秒 0.6 个 tokens 的输出速率，这依旧是一个令人不可思议的工作。因为这是一个跑在 iPhone 17 Pro 上的 400B 大模型！

来自主题: AI资讯

10279 点击 2026-05-02 11:02